iT邦幫忙

2025 iThome 鐵人賽

DAY 1
0
自我挑戰組

探索AI之旅系列 第 1

[Day1] 對三分鐘熱度的人來說...

  • 分享至 

  • xImage
  •  

30天真的是一個超級大的自我挑戰啊~~~

思來想去,必須選擇自己有興趣的主題才有辦法堅持下去,接下來幾天,我將會寫攝影相關的AI知識,請多多指教~
BTW,我會比較偏向分享Azure的模組,因為我上的AI課就是在使用Azure!!


首先想分享Azure AI視覺分析(Azure AI Vision ImageAnalysis),視覺分析目前在日常生活中運用非常廣泛,例如:車牌辨識、交通違規分析(路上一堆科技執法)、無人駕駛物體偵測、臉部辨識以及醫療影像辨識等。


接下來我將歸列出幾個比較常用到的參數以及呈現結果,引用套件的程式碼如下:

from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
# 建立影像分析物件
client = ImageAnalysisClient(endpoint, AzureKeyCredential(key))  # 別忘了放入自己的金鑰跟端點
result = client.analyze(image_bytes,
                        visual_features[VisualFeatures.CAPTION,
                                        VisualFeatures.TAGS,
                                        VisualFeatures.READ,
                                        VisualFeatures.OBJECTS,
                                        VisualFeatures.SMART_CROPS])
  1. 影像描述 CAPTION:分析圖片並產生一段文字描述圖片中的內容
    https://ithelp.ithome.com.tw/upload/images/20250915/20178822qiv1neW5E3.png
    補充:還有一個參數DENSE_CAPTIONS,可以針對多個物體進行影像描述
    https://ithelp.ithome.com.tw/upload/images/20250915/20178822UZrfjdaHX0.png
  2. 影像標籤 TAGS:分析圖片中的元素,例如:天空、藍色、白雲
    https://ithelp.ithome.com.tw/upload/images/20250915/20178822urpVVH6hNX.png
  3. 文字偵測(OCR) READ:將圖檔中的文字轉成可編輯的文字
    補充:光學字元辨識(Optical Character Recognition,OCR),可以將影像、印刷、手寫的資料進行掃描後,轉換成可識別的電子文件,以便搜尋、編輯與儲存,LINE目前就有提供這個功能。
    https://ithelp.ithome.com.tw/upload/images/20250915/20178822NpNkDdFAzm.png
  4. 物體偵測 OBJECTS:偵測圖片中的物體
    https://ithelp.ithome.com.tw/upload/images/20250915/20178822RuKA1I7sP5.png
  5. 智慧裁切 SMART_CROPS:辨識出圖片適合的長寬比,可以搭配Pillow套件將圖片進行裁切
    https://ithelp.ithome.com.tw/upload/images/20250915/20178822RLl5HxudAK.png

今天先這樣,第一次參加鐵人賽,版面不熟悉,這篇文章打了好久,差點放棄(誤
明天繼續努力!


下一篇
[Day2] Google Pixel 10 AI攝影亮點
系列文
探索AI之旅4
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言